智能论文笔记

Material Classification Using Active Temperature Controllable Robotic Gripper

Yukiko Osawa , Kei Kase , Yukiyasu Domae , Yoshiyuki Furukawa , Abderrahmane Kheddar

分类：机器人 | 机器学习

2021-11-30

识别技术允许机器人进行适当的规划和控制策略来操纵各种对象。通过组合多个感知，例如视觉和触觉，对象识别更可靠。每个物体材料的一个显着特征是其热性能，并且分类可以利用热传递，类似于人类热敏。基于热基识别的优点是通过简单地使用微小和廉价的传感器捕获温度变化来实时获得接触表面信息的优点。然而，机器人表面和接触物之间的热传递受初始温度和环境条件的强烈影响。当其温度与机器人格拉伯提示相同时，不能识别给定的物体的材料。我们使用活性温控机器人夹具提出了一种材料分类系统，以诱导热流。随后，我们的系统可以独立地从环境温度识别材料。机器人夹持器表面可以调节到与触摸物体表面不同的任何温度。我们通过将温度控制系统与学术围巾机器人集成，根据使用从抓取目标物体获得的温度数据对其进行分类来进行一些实验。

translated by 谷歌翻译

SkexGen: Autoregressive Generation of CAD Construction Sequences with Disentangled Codebooks

Xiang Xu , Karl D. D. Willis , Joseph G. Lambourne , Chin-Yi Cheng , Pradeep Kumar Jayaraman , Yasutaka Furukawa

分类：计算机视觉 | 机器学习

2022-07-11

我们提出了Kkexgen，这是一种用于计算机辅助设计（CAD）构造序列的新型自回旋生成模型，其中包含草图和伸出的建模操作。我们的模型利用不同的变压器体系结构编码构造序列的拓扑，几何和挤压变化为分离的代码簿。自回归变压器解码器生成CAD构造序列，共享代码簿向量指定的某些属性。广泛的实验表明，我们的删除代码书表示会生成多样化和高质量的CAD模型，增强用户控制，并有效地探索设计空间。该代码可在https://samxuxiang.github.io/skexgen上找到。

translated by 谷歌翻译

Goal-Aware RSS for Complex Scenarios via Program Logic

Ichiro Hasuo , Clovis Eberhart , James Haydon , Jérémy Dubut , Rose Bohrer , Tsutomu Kobayashi , Sasinee Pruekprasert , Xiao-Yi Zhang , Erik André Pallas , Akihisa Yamada

分类：机器人

2022-07-06

我们引入了责任感敏感安全性（RSS）的目标延长，这是一种基于规则的自动驾驶系统安全保证（ADS）的方法。制定RSS规则保证目标实现 - 除了原始RSS中的避免碰撞外，还需要进行长时间的操纵序列的复杂计划。为了应对复杂性，我们基于程序逻辑引入了一个构图推理框架，其中可以系统地为较小的子赛车制定RSS规则，并将它们组合起来以获取用于较大场景的RSS规则。作为框架的基础，我们介绍了一个程序逻辑DFHL，可满足连续的动态和安全条件。我们的框架介绍了基于DFHL的工作流程，用于导出目标感知RSS规则；我们也讨论其软件支持。我们在安全体系结构中使用RSS规则进行了实验评估。它的结果表明，目标感知RSS确实有效地实现了避免碰撞和目标实现目标。

translated by 谷歌翻译

Features of a Splashing Drop on a Solid Surface and the Temporal Evolution extracted through Image-Sequence Classification using an Interpretable Feedforward Neural Network

Jingzu Yee , Daichi Igarashi , Akinori Yamanaka , Yoshiyuki Tagawa

分类：计算机视觉 | 机器学习

2022-07-03

本文报告了在固体表面上溅出的滴滴和时间演化的特征，这些特征是通过图像序列分类提取的，使用高度可解释的前馈神经网络（FNN），其隐藏层为零。用于训练验证和测试FNN的图像序列显示了毫米大小的乙醇滴的早期变形，这些乙醇液滴会影响亲水性玻璃基材，Weber数量范围为31-474（溅出阈值约为173）。进行特定的摄像条件和数字图像处理，以确保图像序列之间的高相似性。结果，受过训练的FNN的测试精度高于96％。值得注意的是，该特征提取表明，受过训练的FNN鉴定出空气动力学上升起的二滴液滴的时间演变，而主体的相对较高的轮廓是溅出的特征，而相对较短的薄片则是相对较短而厚的薄片。非挡板滴的功能。除了溅到和非挡块滴剂之间主体的轮廓高度的差异外，已经确定了这些特征的物理解释及其各自的时间进化。这项研究中报道的观察结果对于开发数据驱动的模拟很重要，以建模对固体表面撞击期间溅出的滴落变形。

translated by 谷歌翻译

Extreme Floorplan Reconstruction by Structure-Hallucinating Transformer Cascades

Sepidehsadat Hosseini , Yasutaka Furukawa

分类：计算机视觉 | 人工智能

2022-06-01

This paper presents an extreme floorplan reconstruction task, a new benchmark for the task, and a neural architecture as a solution. Given a partial floorplan reconstruction inferred or curated from panorama images, the task is to reconstruct a complete floorplan including invisible architectural structures. The proposed neural network 1) encodes an input partial floorplan into a set of latent vectors by convolutional neural networks and a Transformer; and 2) reconstructs an entire floorplan while hallucinating invisible rooms and doors by cascading Transformer decoders. Qualitative and quantitative evaluations demonstrate effectiveness of our approach over the benchmark of 701 houses, outperforming the state-of-the-art reconstruction techniques. We will share our code, models, and data.

translated by 谷歌翻译

Localized Feature Aggregation Module for Semantic Segmentation

Ryouichi Furukawa , Kazuhiro Hotta

分类：计算机视觉

2021-12-03

我们提出了一种新的信息聚合方法，其基于编码器和解码器的特征映射之间的相似性称为本地特征聚合模块。该方法通过强调解码器的特征映射与具有卓越位置信息的特征映射的特征映射的相似性来恢复位置信息。该方法可以比U-Net和U-Net中的传统替代更有效地学习位置信息。此外，该方法还使用局部关注范围来降低计算成本。两种创新有助于提高计算成本较低的分割准确性。通过对果蝇单元格图像数据集和Covid-19图像数据集进行实验，我们证实了我们的方法表现出常规方法。

translated by 谷歌翻译

Optimization of phase-only holograms calculated with scaled diffraction calculation through deep neural networks

Yoshiyuki Ishii , Tomoyoshi Shimobaba , David Blinder , Tobias Birnbaum , Peter Schelkens , Takashi Kakue , Tomoyoshi Ito

分类：计算机视觉

2021-12-02

计算机生成的全息图（CGHS）用于全息三维（3D）显示器和全息投影。使用阶段的CGHS的重建图像的质量降低，因为重建图像的幅度难以控制。迭代优化方法，例如Gerchberg-Saxton（GS）算法是提高图像质量的一个选项。它们以迭代方式优化CGHS以获得更高的图像质量。然而，这种迭代计算是耗时的，并且图像质量的改善通常是停滞的。最近，已经提出了基于深度学习的全息图计算。深神经网络直接从输入图像数据推断出CGHS。然而，它仅限于重建与全息图相同的图像。在这项研究中，我们使用深度学习来优化使用缩放衍射计算和随机相位的方法生成的阶段CGHS。通过将随机相移方法与缩放的衍射计算组合，可以处理大于全息图的缩放重建图像。与GS算法相比，所提出的方法优化高质量和速度。

translated by 谷歌翻译

HEAT: Holistic Edge Attention Transformer for Structured Reconstruction

Jiacheng Chen , Yiming Qian , Yasutaka Furukawa

分类：计算机视觉

2021-11-30

本文介绍了一种用于结构重建的新型关注的神经网络，其将2D光栅图像作为输入，并重建描绘底层几何结构的平面图。该方法检测角落，并以端到端的方式对角之间进行分类边缘候选。我们的贡献是整体边缘分类架构，其中1）通过其端点的三角位置编码初始化边缘候选的特征; 2）通过可变形的关注将图像特征融合到每个边缘候选; 3）采用两个重量分配变压器解码器，用于在图形边缘候选方面学习整体结构模式; 4）通过掩盖的学习策略培训。拐角探测器是边缘分类架构的变体，适用于作为转角候选的像素上操作。我们对两种结构化重建任务进行实验：户外建筑架构和室内平面平面图形重建。广泛的定性和量化评估表明了我们对现有技术的方法的优势。我们将分享代码和模型。

translated by 谷歌翻译

Multi-task manifold learning for small sample size datasets

Hideaki Ishibashi , Kazushi Higa , Tetsuo Furukawa

分类：机器学习 | (统计)机器学习

2021-11-23

在这项研究中，我们开发了一种用于多任务歧管学习的方法。该方法旨在提高多项任务的歧管学习的性能，特别是当每个任务具有少量样本时。此外，除了用于现有任务的新样本之外，该方法还旨在为新任务生成新的样本。在所提出的方法中，我们使用两种不同类型的信息传输：实例传输和模型传输。例如，转移，数据集在类似的任务之间合并，而对于模型传输，歧管模型在类似的任务之间取平均值。为此目的，所提出的方法包括一组与任务相对应的一组生成歧管模型，其集成到光纤束的一般模型中。我们将所提出的方法应用于人工数据集和面部图像集，结果表明该方法能够估计歧管，即使对于微小的样品。

translated by 谷歌翻译

Learning suction graspability considering grasp quality and robot reachability for bin-picking

Ping Jiang , Junji Oaki , Yoshiyuki Ishihara , Junichiro Ooga , Haifeng Han , Atsushi Sugahara , Seiji Tokura , Haruna Eto , Kazuma Komoda , Akihito Ogawa

分类：机器人 | 机器学习

2021-11-04

深度学习已被广泛用于推断强大的掌握。虽然最初用于学习掌握配置的人类标记的RGB-D数据集，但是这种大型数据集的准备是昂贵的。为了解决这个问题，通过物理模拟器生成图像，并且使用物理启发模型（例如，抽吸真空杯和物体之间的接触型号）作为掌握质量评估度量来注释合成图像。然而，这种联系方式复杂，需要通过实验进行参数识别，以确保真实的世界表现。此外，以前的研究还没有考虑机器人可达性，例如当具有高抓握质量的掌握配置由于机器人的碰撞或物理限制而无法到达目标时无法到达目标。在这项研究中，我们提出了一种直观的几何分析掌握质量评估度量。我们进一步纳入了可达性评估度量。我们通过拟议的评估度量对模拟器中的合成图像上的综合评估标准进行注释，以培训称为抽吸贪污U-Net ++（SG-U-Net ++）的自动编码器解码器。实验结果表明，我们直观的掌握质量评估度量与物理启发度量有竞争力。学习可达性有助于通过消除明显无法访问的候选者来减少运动规划计算时间。该系统实现了560pph（每小时碎片）的整体拾取速度。

translated by 谷歌翻译